Inducción de un Lexicón de Opinión Orientado al Dominio

نویسندگان

  • Fermín L. Cruz
  • José Antonio Troyano Jiménez
  • F. Javier Ortega
  • Carlos G. Vallejo
چکیده

In this paper we explain the building of an English lexicon of adjectives and their semantic orientations. Rather than defining the semantic orientation of a term as a single value, we induce many real values representing the semantic orientation of that term being used in different domains. The automatic building of this resource has been based on the construction of graphs from conjunctive expressions between adjectives observed in a review corpus. A modified PageRank algorithm, adapted to be used with graphs with positive and negative edges, was applied to these graphs to obtain the values for the semantic orientation of terms. The method has been evaluated using Micro-WNOp, getting similar results or even better than those reported by some recent papers.

برای دانلود متن کامل این مقاله و بیش از 32 میلیون مقاله دیگر ابتدا ثبت نام کنید

ثبت نام

اگر عضو سایت هستید لطفا وارد حساب کاربری خود شوید

منابع مشابه

eSOLHotel: Generación de un lexicón de opinión en español adaptado al dominio turístico

Since Web 2.0 is the largest container for subjective expressions about different topics or issues expressed in all languages, the study of Sentiment Analysis has grown exponentially. In this work, we focus on Spanish polarity classification of hotel reviews and a new domain-dependent lexical resource (eSOLHotel) is presented. This new lexicon has been compiled following a corpus-based approach...

متن کامل

Matxin-Informatika: versión del traductor Matxin adaptada al dominio de la informática

Desarrollo de un corpus de postedición para su uso en postedición estadística Recopilación de corpus paralelo ● Del dominio de la informática ● Creado en la localización de Sw Tratamiento del corpus ● Analizado, lematizado y procesado con Giza++ ● Para cada lema (es) se extraen: ● sus posibles traducciones (eu) ● y su probabilidad Uso ● Reordenación de equivalencias en 444 entradas del lexicón ...

متن کامل

Anotación automática de datos acerca de la reputación de los políticos en redes sociales

Resumen. Recientemente, la minerı́a de opinión en Twitter, por medio de la Recuperación de Información (RI) y del Procesamiento de Lenguage Natural (PLN) atrajo interés en la investigación polı́tica. Sin embargo, la obtención de datos anotados de dominio especı́fico sigue siendo un paso manual muy costoso. Además, la cantidad y calidad de estas anotaciones pueden ser crı́ticas en relación al rendim...

متن کامل

Desarrollo de un compresor de textos orientado a palabras basado en PPM

Resumen Reducir el espacio de almacenamiento y el tiempo de transferencia se ha vuelto un aspecto fundamental en las Bases de Datos Textuales. En este trabajo se presenta un nuevo compresor, denominado PPM orientado a palabras (SWPPM), en el que se aplican los modelos estad́ısticos propios de PPM utilizando como śımbolos de entrada las palabras. Presenta varios desaf́ıos técnicos para los que es ...

متن کامل

Inducción de constituyentes sintácticos en español con técnicas de clustering y filtrado por información mutua

El Argumento de la Pobreza de los Estímulos (Argument from the Poverty of Stimulus, APS) se presenta como el gran campo de debate epistemológico entre el paradigma simbólico y el paradigma estadístico en lingüística computacional (Pullum y Scholz 2002). Desde 2000 en adelante aparecieron algunos trabajos dentro del paradigma estadístico que se propusieron atacar el Argumento de la Pobreza de lo...

متن کامل

ذخیره در منابع من


  با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید

برای دانلود متن کامل این مقاله و بیش از 32 میلیون مقاله دیگر ابتدا ثبت نام کنید

ثبت نام

اگر عضو سایت هستید لطفا وارد حساب کاربری خود شوید

عنوان ژورنال:
  • Procesamiento del Lenguaje Natural

دوره 43  شماره 

صفحات  -

تاریخ انتشار 2009